*Candidates
*https://dadosabertos.tse.jus.br/dataset/?groups=candidatos
*2012: 22 Jul 2022 
*2016: 08 Apr 2021 
*2020: 07 Oct 2023 
*2024: 13 Jan 2025 

else if "`c(username)'" == "Administrador" { 
	global ROOT "C:\Users\Administrador\Meu Drive\00 Pesquisa\# Gender Gap Turnout"
}


if "`c(username)'" == "vitor" {
    global ROOT "G:\.shortcut-targets-by-id\1Gn0Qh8ehM2EKoEEeJt9JcaQDco2Xt0O2\# Gender Gap Turnout"
}


local anos 2012 2016 2020
foreach ano in `anos' {
    local arquivo "${ROOT}\Dados e Análise\TSE Data\Candidates\consulta_cand_`ano'_BRASIL.csv"
    import delimited "`arquivo'", delimiter(";") clear
	keep if ds_cargo == "PREFEITO"
	drop if ds_situacao_candidatura == "INAPTO"
	keep nm_candidato sq_candidato sg_ue ano_eleicao nr_turno ds_cargo nr_idade_data_posse ds_genero ds_grau_instrucao sg_partido ds_estado_civil ds_cor_raca ds_ocupacao dt_nascimento
    save "${ROOT}\Dados e Análise\TSE Data\Candidates\dados_`ano'.dta", replace
}

import delimited "${ROOT}\Dados e Análise\TSE Data\Candidates\consulta_cand_2024_BRASIL.csv", delimiter(";") clear
keep if ds_cargo == "PREFEITO"
keep nm_candidato dt_geracao sq_candidato sg_ue ano_eleicao nr_turno ds_cargo ds_genero ds_grau_instrucao sg_partido ds_estado_civil ds_cor_raca ds_ocupacao dt_nascimento 
gen data_geracao = date(dt_geracao, "DMY")
gen data_nascimento = date(dt_nascimento, "DMY")
format data_geracao data_nascimento %td
gen nr_idade_data_posse = floor((data_geracao - data_nascimento) / 365.25)
keep nm_candidato sq_candidato sg_ue ano_eleicao nr_turno ds_cargo nr_idade_data_posse ds_genero ds_grau_instrucao sg_partido ds_estado_civil ds_cor_raca ds_ocupacao dt_nascimento
save "${ROOT}\Dados e Análise\TSE Data\Candidates\dados_2024.dta", replace
	
use "${ROOT}\Dados e Análise\TSE Data\Candidates\dados_2012.dta", clear
append using "${ROOT}\Dados e Análise\TSE Data\Candidates\dados_2016.dta"
append using "${ROOT}\Dados e Análise\TSE Data\Candidates\dados_2020.dta"
append using "${ROOT}\Dados e Análise\TSE Data\Candidates\dados_2024.dta"

*Rename variables
rename sg_ue cd_municipio
rename nr_turno turno
rename ds_grau_instrucao escolaridade
rename ds_estado_civil estado_civil
rename ds_cor_raca raca
rename ds_ocupacao ocupacao
rename nr_idade_data_posse idade
rename ds_genero genero 
rename sg_partido partido

duplicates drop sq_candidato cd_municipio ano_eleicao turno, force
*Duplicates were checked and refer to the same candidate, with minor changes in variables that are not relevant to the research between one observation and another for the same candidate.
rename nm_candidato nm_candidato2
keep ano_eleicao cd_municipio turno escolaridade estado_civil raca ocupacao idade sq_candidato nm_candidato2 genero partido

drop if idade == 7
drop if idade == 967
drop if idade == 999

save "${ROOT}\Dados e Análise\TSE Data\Candidates\candidates.dta", replace

erase "${ROOT}\Dados e Análise\TSE Data\Candidates\dados_2012.dta"
erase "${ROOT}\Dados e Análise\TSE Data\Candidates\dados_2016.dta"
erase "${ROOT}\Dados e Análise\TSE Data\Candidates\dados_2020.dta"
erase "${ROOT}\Dados e Análise\TSE Data\Candidates\dados_2024.dta"
